TP1 - Probabilidad discreta

Análisis estadístico de datos, 2021

Alvaro Concha


Ejercicio 1

Dada la variable aleatoria $X$ y la constante $a$, calcular los siguientes valores en términos de $\mu = E(X)$:

Solución

Usamos la linealidad del valor esperado.


Ejercicio 2

Dada la variable aleatoria $X$ y la constante $a$, demostrar las siguientes identidades:

Usando la definición de varianza $Var(X) = E[(X - \mu)^2]$, con $\mu = E(X)$.

Y la linealidad del valor esperado.


Ejercicio 3

Dadas las variables independientes $X$ e $Y$ , mostrar que:

Solución

Sean las variables discretas independientes $X$ e $Y$ con espacios muestrales $\Omega_X$ y $\Omega_Y$, respectivamente.

Como son independientes, la probabilidad conjunta es $P(X=x, Y=y) = P(X=x)P(Y=y)$.

Para lo cual es necesario probar además que, para variables independientes $$ \begin{align*} E(XY) &= \\ &= \sum_{x\in\Omega_X}\sum_{y\in\Omega_Y} xy P(X=x, Y=y)\\ &= \sum_{x\in\Omega_X}\sum_{y\in\Omega_Y} xy P(X=x)(Y=y)\\ &= \sum_{x\in\Omega_X} xP(X=x) \sum_{y\in\Omega_Y} y(Y=y)\\ &= E(X)E(Y) \end{align*} $$


Ejercicio 4

Mostrar que la distribución binomial está normalizada a la unidad sumando todos los términos de la función de distribución de probabilidad.

Solución

Sea la variable aleatoria $K\sim B(np)$.

Su función de masa de probabilidad es $$ P(K=k) = {n\choose k} p^k (1-p)^{n-k}, $$ con $k\le n$.

Luego, la suma sobre todos los resultados posibles es $$ \begin{align*} \sum_{k\le n} P(K=k) &= \sum_{k\le n} {n\choose k} p^k (1-p)^{n-k}\\ &= [p + (1-p)]^n\\ &= 1 \end{align*} $$


Ejercicio 5: El test serológico de la covid-19

Los tests serológicos detectan la presencia de anticuerpos en la sangre.

Este artículo muestra una comparación de la sensitividad y especifidad de diez tipos de tests diferentes.

Los investigadores encontraron que, como referencia, los tests son 90% sensitivos y 95% específicos.

Suponiendo que solo el 10% de la población tiene anticuerpos covid-19, calcular la probabilidad que una persona con un test positivo efectivamente tenga anticuerpos.

Solución

Características del test:

Supuestos:

Tarea:

Formalización:

$$ \begin{align*} P(C=+,T=+) &= P(T=+|C=+) P(C=+)\\ &= 0.9 \times 0.1\\ &= 0.09 \end{align*} $$ $$ \begin{align*} P(T=+) &= \sum_{c\in\{+, -\}} P(T=+,C=c)\\ &= \sum_{c\in\{+, -\}} P(T=+|C=c) P(C=c)\\ &= P(T=+|C=+) P(C=+) + P(T=+|C=-) P(C=-)\\ &= 0.9 \times 0.1 + (1-0.95) \times (1-0.1)\\ &= 0.135 \end{align*} $$

Ejercicio 6: Ayuda a Fermat

La solución de Fermat al problema de la división justa de la bolsa es impráctica cuando quedan muchas rondas por jugar ya que implica contar todas las partidas que dan por ganador a uno de los dos jugadores.

Afortunadamente con simulaciones Monte Carlo es posible encontrar una solución aproximada.

Supongamos que un juego de 51 rondas es interrumpido en la ronda 25 y que Fermat ganó 15 rondas y Pascal 10.

Simular el resto de las rondas para decidir cuál jugador gana la partida.

Repetir este procedimiento 1000 veces para encontrar la división justa de la bolsa.

Solución

Setup:

Solución exacta:

$$ \alpha = \frac{1}{2^{n_\mathrm{rest}}} \sum_{k=0}^{s-1} {r+s-1\choose k} $$

Ejercicio 7: El número de la suerte

Simular el lanzamiento de cinco dados y contar cuántas veces sale el número tres.

Repetir la operación 1000 veces y construir un histograma de frecuencia con el número de ocurrencias del número tres.

Comparar los datos simulados con una función de distribución binomial con parámetros $n$ y $p$ adecuados.

Solución

Set-up:


Ejercicio 8: El jugador de dardos torpe

Simular el lanzamiento de dardos considerando que:

Un jugador torpe lanza dardos al azar dentro del anillo doble de la diana.

Calcular la probabilidad que un tiro individual dé en el blanco exterior.

Simular una corrida de 100 lanzamientos y contar cuántos dardos dan en el blanco exterior.

Simular 1000 corridas y construir un histograma de frecuencia.

Comparar con una distribución de Poisson.

Diana de dardos estándar Figure 1: Diana de dardos estándar.

Solución

Set-up:

$$ P(K=k) = \exp(-\mu) \frac{\mu^k}{k!} $$

Ejercicio 9

Simular dos variables aleatorias $X_1$ y $X_2$ que siguen distribuciones de Poisson con parámetros $\mu_1 = 1$ y $\mu_2 = 2$ respectivamente.

Calcular la variable $Y = X_1 + X_2$.

Repetir la simulación 1000 veces.

Graficar la distribución de la variable $Y$ y comparar con una distribución de probabilidad adecuada.

Solución

Set-up:

$$ p_Y = p_{X_1} * p_{X_2} $$$$ \begin{align*} p_Y(y) &= \sum_x p_{X_1}(x) p_{X_2}(y-x)\\ &= Pois[\mu_1 + \mu_2](y) \end{align*} $$

Ejercicio 10 (Para entregar)

Simular una variable aleatoria Y que sigue una distribución de Poisson con parámetro $\mu = 10$.

Suponer que el resultado de la simulación es $Y = k$.

A continuación simular $k$ variables de Bernoulli $X_i$ con $i = 1, \dots, k$ con parámetro $p = 0.7$.

Calcular el valor de una nueva variable Z definida como $Z = \sum_{i=1}^k X_i$.

Repetir la simulación 1000 veces, construir un histograma de frecuencia de $Z$ y comparar con una distribución de Poisson.

Nota: usar la distribución exacta sin ajustar los datos.

Solución

Set-up: